بهسازی گفتار با استفاده از ویونت

thesis
  • وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق
  • author سمیرا مغانی
  • adviser حسین مروی
  • publication year 1391
abstract

بهسازی گفتار یا speech enhancement بیانگر گروه بزرگی از روش هاست که با انجام پردازش هایی روی سیگنال های نویزی، نهایتا منجر به بهبود کیفیت و قابلیت فهم گفتار می شود. تاکنون چندین روش در زمینه بهسازی گفتار نویزی ارائه شده است. روش پیشنهادی ما در این پایان نامه، شبکه عصبی موجک (ویونت) می باشد. این روش، مدلی مبتنی بر تلفیق شبکه عصبی با تبدیل موجک می باشد و به عنوان جایگزین مناسب در شبکه های عصبی پسخورد جهت تخمین و تقریب توابع غیرخطی اختیاری پیشنهاد می شود. در شبکه استاندارد پسخورد تابع فعال سازی نرون لایه پنهان یک تابع سیگموئید است. حال آنکه شبکه های عصبی موجک توابع موجک را به عنوان توابع فعالسازی نرون های لایه پنهان از شبکه پسخور مورد استفاده قرار میدهند. در روش پیشنهادی دو حالت برای دسترسی به نویز در نظر گرفته شد. حالت الف، حالتی است که دسترسی مستقیم به نویز محیط وجود دارد و حالت ب، حالتی است که از تخمین نویز استفاده کرده ایم. روش پیشنهادی برای تخمین نویز، استفاده از تبدیل موجک می باشد. موجک استفاده شده در این مرحله دابیشز 5 (db5) می باشد. روش پیشنهادی برای دادگان فارسی پیاده سازی شده است و برای ارزیابی و عملکرد آن از سه معیار سیگنال به نویز، سیگنال به نویز قطعه ای وlog likellihood ratio (llr) استفاده شده است. در نهایت روش پیشنهادی با شبکه عصبی و ترکیب شبکه عصبی با موجک و روش موجک مقایسه شده است. بررسی نتایج و آزمایشات نشان دهنده عملکرد قابل قبول روش پیشنهادی است.

similar resources

بهسازی گفتار با استفاده از گذرای سیگنال

در دهه های گذشته تحقیقات گسترده ای برای بهبود فهم گفتار نویزی انجام شده است. این تحقیقات می تواند به 2 گروه تقسیم شود :روش های کاهش نویز و بهبود گفتار یا مقاوم سازی گفتار. گروه اول شامل تکنیک هایی است که نویز ترکیب شده با گفتار را با کمترین تاثیر روی فهم گفتار کاهش می دهد. این روش ها در شرایطی که ماهیت نویز نامعلوم باشد به خوبی کار نمی کنند. این گروه از روش های بهسازی سیگنال گفتار، روش کاهش نوی...

15 صفحه اول

بهسازی گفتار تک‌کاناله با استفاده از ترکیب مدل قطعی نمایی و مدل تصادفی t Location-Scale

بیشتر روش‌های بهسازی گفتار، تخمینگری کاملاً متکی به مدل تصادفی گفتار ارائه می‌دهند. در این مقاله، یک تخمینگر کمترین میانگین مربعات خطا تحت یک مدل قطعی - تصادفی پیشنهاد می‌شود که در آن از یک توزیع دنباله - سنگین به نام(tls)  t location-scale برای مدل‌کردن ضرایب تبدیل فوریه گسسته گفتار تمیز و از مدل نمایی و سینوسی به‌عنوان مدل قطعی استفاده شده است. در مدل نمایی به‌کاررفته، تخمین ...

full text

بهسازی گفتار با استفاده سیستمهای gsc

نویز و انعکاس مهمترین عوامل محیطی موثر در تخریب سیگنال گفتار محسوب می شوند. هدف از این تحقیق بررسی یکی از پرکاربردترین ساختارهای بهسازی گفتار با نام حذف کننده لوب های فرعی (gsc) در مقابله با نویزهای جهت دار محیط است.به دنبال کاربردهای زیاد ساختار gsc برای حذف نویزهای جهت دار در حوزه سیگنال های باندباریک (همچون رادار، سونار و ...)، استفاده از این ساختار با هدف مقابله با نویزهای باندوسیع موجود بر...

بهسازی گفتار با تخمین گر کمترین میانگین مربعات خطا برپایه توزیع مخلوط لاپلاس برای گفتار

In this paper an estimator of speech spectrum for speech enhancement based on Laplacian Mixture Model has been proposed. We present an analytical solution for estimating the complex DFT coefficients with the MMSE estimator when the clean speech DFT coefficients are mixture of Laplacians distributed. The distribution of the DFT coefficients of noise are assumed zero-mean Gaussian.The drived MMSE...

full text

بهسازی وفقی سیگنال گفتار در محیط‌های واقعی با استفاده از ساختار ترکیبی مبتنی بر شکل‌دهنده‌های پرتو و فیلتر پسینه

تنوع میدان‌های نویزی حاکم بر محیط‌های واقعی، طراحی سیستم واحدی را که قادر به حذف کامل همه اغتشاشات محیطی باشد، با مشکل مواجه می‌کند. لذا، داشتن یک شناخت اولیه از میدان‌های نویزی موجود در محیط و بررسی نوع اثر هر یک بر روی سیگنال گفتار، گام مؤثری در جهت فرآیند بهسازی محسوب می‌شود. در این مقاله، ضمن بررسی نویزهای اساسی موجود در زمینه گفتار ضبط‌شده در شرایط واقعی، به ارزیابی میدان‌های نویزی پایین‌گ...

full text

بهسازی گفتار با تخمین گر کمترین میانگین مربعات خطا برپایه توزیع مخلوط لاپلاس برای گفتار

در این مقاله یک روش بهسازی گفتار آماری با فرض توزیع مخلوط لاپلاس برای گفتار، برای تخمین سیگنال گفتار تمیز (بدون نویز) از سیگنال گفتار نویزی ارائه شده است. در روش پیشنهادی، ضرایب تبدیل فوریه زمان کوتاه گسسته سیگنال گفتار با استفاده از تخمین گر کمترین میانگین مربعات خطا، بدست می آید. در این تخمین، فرض می شود که تابع چگالی احتمال ضرایب تبدیل فوریه سیگنال تمیز و نویز به ترتیب، مخلوط لاپلاس و گوسی ب...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023